使用水下车辆监测珊瑚礁可通过收集大量图像来增加海洋调查的范围和历史生态数据的可用性。可以使用经过训练的语义分割的模型来对该图像进行分析,但是它太成本且耗时,无法将图像密集标记,以用于训练监督模型。在这封信中,我们利用具有稀疏点标签的生态学家标记的照片图像图像。我们提出了一种点标签的方法,用于在超级像素区域内传播标签,以获得增强的地面真理,以训练语义分割模型。我们的点标签意识到的Superpixel方法利用了稀疏点标签,并使用学到的功能将像素簇精确地生成杂物,复杂的珊瑚图像中的单物种段。对于像素精度,我们的方法优于UCSD马赛克数据集上的先验方法,而对于标签传播任务,平均值IOU为8.35%,同时将以前方法报告的计算时间缩短了76%。我们在UCSD Mosaics DataSet上训练DeepLaBV3+架构和胜过语义细分的最先进2.91%,而平均值为9.65%,Pixel的精度为4.19%,而对于Eilat DataSet的IOU,则为14.32% 。
translated by 谷歌翻译
We consider optimizing a function network in the noise-free grey-box setting with RKHS function classes, where the exact intermediate results are observable. We assume that the structure of the network is known (but not the underlying functions comprising it), and we study three types of structures: (1) chain: a cascade of scalar-valued functions, (2) multi-output chain: a cascade of vector-valued functions, and (3) feed-forward network: a fully connected feed-forward network of scalar-valued functions. We propose a sequential upper confidence bound based algorithm GPN-UCB along with a general theoretical upper bound on the cumulative regret. For the Mat\'ern kernel, we additionally propose a non-adaptive sampling based method along with its theoretical upper bound on the simple regret. We also provide algorithm-independent lower bounds on the simple regret and cumulative regret, showing that GPN-UCB is near-optimal for chains and multi-output chains in broad cases of interest.
translated by 谷歌翻译
Normalizing flows are constructed from a base distribution with a known density and a diffeomorphism with a tractable Jacobian. The base density of a normalizing flow can be parameterised by a different normalizing flow, thus allowing maps to be found between arbitrary distributions. We demonstrate and explore the utility of this approach and show it is particularly interesting in the case of conditional normalizing flows and for introducing optimal transport constraints on maps that are constructed using normalizing flows.
translated by 谷歌翻译
近年来,在诸如denoing,压缩感应,介入和超分辨率等反问题中使用深度学习方法的使用取得了重大进展。尽管这种作品主要是由实践算法和实验驱动的,但它也引起了各种有趣的理论问题。在本文中,我们调查了这一作品中一些突出的理论发展,尤其是生成先验,未经训练的神经网络先验和展开算法。除了总结这些主题中的现有结果外,我们还强调了一些持续的挑战和开放问题。
translated by 谷歌翻译
差异化私有(DP)合成数据是一种最大化包含敏感信息数据的实用性的有前途的方法。但是,由于抑制了代表性不足的阶级,这些阶级通常需要实现隐私,因此,它可能与公平冲突。我们评估了四个DP合成器,并提出了经验结果,表明这些模型中的三个经常在下游二进制分类任务上降低公平性结果。我们在生成的合成数据中存在公平性与存在的少数群体比例之间建立联系,并发现通过多标签下采样方法预处理的数据训练合成器可以促进更公平的结果而不会降低准确性。
translated by 谷歌翻译
在本文中,我们研究了主要成分分析的问题,并采用了生成建模假设,采用了一个普通矩阵的通用模型,该模型包括涉及尖峰矩阵恢复和相位检索在内的明显特殊情况。关键假设是,基础信号位于$ l $ -Lipschitz连续生成模型的范围内,该模型具有有限的$ k $二维输入。我们提出了一个二次估计器,并证明它享有顺序的统计率$ \ sqrt {\ frac {k \ log l} {m} {m}} $,其中$ m $是样本的数量。我们还提供了近乎匹配的算法独立的下限。此外,我们提供了经典功率方法的一种变体,该方法将计算的数据投射到每次迭代期间生成模型的范围内。我们表明,在适当的条件下,该方法将指数级的快速收敛到达到上述统计率的点。我们在各种图像数据集上对峰值矩阵和相位检索模型进行实验,并说明了我们方法的性能提高到经典功率方法,并为稀疏主组件分析设计了截断的功率方法。
translated by 谷歌翻译
基于内核的模型,例如内核脊回归和高斯工艺在机器学习应用程序中无处不在,用于回归和优化。众所周知,基于内核的模型的主要缺点是高计算成本。给定$ n $样本的数据集,成本增长为$ \ Mathcal {o}(n^3)$。在某些情况下,现有的稀疏近似方法可以大大降低计算成本,从而有效地将实际成本降低到$ \ natercal {o}(n)$。尽管取得了显着的经验成功,但由于近似值而导致的误差的分析范围的现有结果仍然存在显着差距。在这项工作中,我们为NyStr \“ Om方法和稀疏变分高斯过程近似方法提供新颖的置信区间,我们使用模型的近似(代理)后差解释来建立这些方法。我们的置信区间可改善性能。回归和优化问题的界限。
translated by 谷歌翻译
归一化流量是漫射的,通常是维持尺寸保存,使用模型的可能性训练的模型。我们使用Surve Framework通过新的层构建尺寸减少调节流量,称为漏斗。我们展示了对各种数据集的功效,并表明它改善或匹配现有流量的性能,同时具有降低的潜在空间尺寸。漏斗层可以由各种变换构成,包括限制卷积和馈送前部。
translated by 谷歌翻译
在本文中,我们介绍了一个多武装的强盗问题被称为MAX-MIN分组的匪徒,其中臂在可能重叠的群体中排列,并且目标是找到最糟糕的均值奖励的组。此问题对推荐系统等应用感兴趣,并且与广泛研究的鲁棒优化问题也密切相关。我们呈现了两种基于算法的连续消除和稳健的优化,并导出了样本数量的上限,以保证找到最大最佳或近最佳组,以及算法无关的下限。我们讨论了各种兴趣案件中我们界的紧绷程度,以及衍生均匀紧张的界限。
translated by 谷歌翻译
高斯工艺(GP)是一种广泛的工具,用于依次优化黑框功能,其中评估昂贵且潜在的嘈杂。关于GP土匪的最新作品提议超越随机噪声,并设计算法对对抗性攻击的强大。本文从攻击者的角度研究了这个问题,提出了各种对抗性攻击方法,对攻击者的力量和先前信息的假设有所不同。我们的目标是从理论和实践的角度了解对GP土匪的对抗性攻击。我们主要关注对流行的GP-UCB算法的有针对性攻击和基于消除的算法的相关算法,基于对抗性扰动该函数$ f $以产生另一个函数$ \ tilde $ \ tilde {f} $,其Optima在某些目标区域中$ \ \ Mathcal {r} _ {\ rm target} $。根据我们的理论分析,我们设计了白盒攻击(已知$ F $)和黑盒攻击(未知$ F $),前者包括减法攻击和裁剪攻击,以及后者,包括激进的减法攻击。我们证明,对GP土匪的对抗性攻击也可以成功强迫该算法向$ \ Mathcal {R} _ {\ rm Target} $,即使在低攻击预算的情况下,我们也可以测试攻击对各种客观功能的有效性。
translated by 谷歌翻译